МОДЕЛЬ ИНСТРУМЕНТАЛЬНОГО СРЕДСТВА АВТОМАТИЗИРОВАННОГО СИНТЕЗА АППАРАТНЫХ УСКОРИТЕЛЕЙ СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ПРОГРАММИРУЕМЫХ ЛОГИЧЕСКИХ ИНТЕГРАЛЬНЫХ СХЕМ
Аннотация:
В настоящее время все больше задач по обработке и анализу изображений решаются с использованием сверточных нейронных сетей. Сети, реализованные с использованием высокоуровневых языков программирования, библиотек и фреймворков невозможно использовать в системах реального времени, например, для обработки потокового видео в вычислительной системе автомобиля, из-за низкой скорости и энергоэффективности таких реализаций. Для подобных задач необходимо использовать специализированные аппаратные ускорители нейронных сетей. Проектирование таких ускорителей является сложным итеративным процессом, требующим узкоспециализированных знаний и квалификации. Это делает актуальным вопрос создания средств автоматизации высокоуровневого синтеза подобных вычислителей. Целью исследования стала разработка средства автоматизированного синтеза нейросетевых ускорителей из высокоуровневой спецификации, позволяющего снизить время разработки таких ускорителей для устройств программируемой логики. В качестве высокоуровневой спецификации используется описание сетей, которое можно получить с помощью фреймворка TensorFlow. Проведено исследование нескольких стратегий оптимизации структуры сверточных сетей, способов организации вычислительного процесса и форматов представления данных в нейронных сетях и их влияния на характери- стики получаемого вычислителя. Показано, что оптимизация структуры полносвязных слоев нейронной сети на примере решения задачи распознавания рукописных цифр из набора MNIST сокращает количество параметров сети на 95 % с потерей точности около 0,43 %, конвейеризация вычислений ускоряет расчет в 1,7 раз, а благодаря распараллеливанию отдельных частей вычислительного процесса достигается ускорение почти в 20 раз, хотя на это и требуется в 4–6 раз больше ресурсов программируемых логических интегральных схем. Переход в вычислениях от чисел с плавающей точкой к числам с фиксированной точкой позволяет сократить используемые ресурсы в 1,7–2,8 раз. Проведен анализ полученных результатов, и предложена модель инструментального средства автоматизированного синтеза, которая позволяет выполнить обозначенные оптимизации с целью удовлетворения предъявляемых требований по быстродействию и используемым ресурсам при реализации нейросетевых ускорителей на микросхемах программируемых логических интегральных схем.
Ключевые слова:
Постоянный URL
Статьи в номере
- АННОТАЦИЯ НОМЕРА
- ТЕХНОЛОГИЯ БЛОКЧЕЙН В СЕТЯХ 5G
- ЧИСЛЕННОЕ МОДЕЛИРОВАНИЕ ЛАЗЕРНОГО НАГРЕВА ТИТАНСОДЕРЖАЩЕГО ОПТОТЕРМИЧЕСКОГО ВОЛОКОННОГО КОНВЕРТЕРА И СТЕНКИ ВЕНЫ В ПРОЦЕССЕ ЭНДОВАЗАЛЬНОЙ ЛАЗЕРНОЙ КОАГУЛЯЦИИ
- ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ ВЛИЯНИЯ ОПТИЧЕСКОЙ МОЩНОСТИ НА ФОРМИРОВАНИЕ СТРУКТУРЫ ВОЛОКОННО-ОПТИЧЕСКОГО РАССЕИВАТЕЛЯ, ПОЛУЧЕННОГО ПУТЕМ ПЛАВЛЕНИЯ СЕРДЦЕВИНЫ СВЕТОВОДА
- ИССЛЕДОВАНИЕ МЕТОДОВ СОЗДАНИЯ ГОРЯЧЕЙ ПРОВОЛОКИ ВОЛОКОННО-ОПТИЧЕСКОГО ТЕПЛОВОГО АНЕМОМЕТРА
- ИССЛЕДОВАНИЕ ВЛИЯНИЯ ВНЕШНЕГО ОТНОСИТЕЛЬНОГО ДАВЛЕНИЯ НА СДВИГ ФАЗЫ В ИНТЕРФЕРОМЕТРЕ САНЬЯКА
- ИССЛЕДОВАНИЕ АБСОРЦИОННЫХ ХАРАКТЕРИСТИК СЕРЕБРЯНЫХ ИОНООБМЕННЫХ СЛОЕВ В ХЛОРИДНОМ ФОТО-ТЕРМО-РЕФРАКТИВНОМ СТЕКЛЕ(на англ. яз.)
- СПЕКТРАЛЬНО-ЛЮМИНЕСЦЕНТНЫЕ СВОЙСТВА ЭРБИЯ В БРОМИДНО-ФТОРИДНЫХ ФОТО-ТЕРМО-РЕФРАКТИВНЫХ СТЕКЛАХ
- МЕТОД АВТОМАТИЧЕСКОГО ВИДЕОАНАЛИЗА ДВИЖЕНИЙ РУК И РАСПОЗНАВАНИЯ ЖЕСТОВ В ЧЕЛОВЕКО-МАШИННЫХ ИНТЕРФЕЙСАХ
- СОВРЕМЕННЫЕ ПОДХОДЫ К МУЛЬТИКЛАССОВОЙ КЛАССИФИКАЦИИ ИНТЕНТОВ НА ОСНОВЕ ПРЕДОБУЧЕННЫХ ТРАНСФОРМЕРОВ(на англ. яз.)
- ЭФФЕКТИВНАЯ РЕАЛИЗАЦИЯ СОВРЕМЕННОЙ КРИПТОСИСТЕМЫ МАК-ЭЛИСА, ПОСТРОЕННОЙ НА ОБОБЩЕННЫХ (L, G)-КОДАХ
- ЗАДАЧА НОРМАЛИЗАЦИЙ СЛОВ КАЗАХСКОГО ЯЗЫКА
- АНАЛИЗ ДЕФЕКТОВ ПОВЕРХНОСТИ ИЗДЕЛИЯ ПРИ 3D-ПЕЧАТИ ПО ИХ ИЗОБРАЖЕНИЯМ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ
- ОРГАНИЗАЦИЯ РЕЗЕРВИРОВАНИЯ ПАКЕТОВ ПРИ МНОГОПУТЕВЫХ ПЕРЕДАЧАХ РЕАЛЬНОГО ВРЕМЕНИ
- ПРИМЕНЕНИЕ МОДУЛЬНОГО ПОДХОДА ПРИ РАЗРАБОТКЕ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ ОБОРУДОВАНИЯ С ЧИСЛОВЫМ ПРОГРАММНЫМ УПРАВЛЕНИЕМ
- ПАРАМЕТРИЧЕСКАЯ ИДЕНТИФИКАЦИЯ ДИФФЕРЕНЦИАЛЬНО-РАЗНОСТНЫХ МОДЕЛЕЙ ТЕПЛОПЕРЕНОСА В ОДНОМЕРНЫХ ТЕЛАХ НА ОСНОВЕ АЛГОРИТМОВ ФИЛЬТРА КАЛМАНА
- ВЫБОР КОМПОЗИЦИОННОГО МАТЕРИАЛА В ДАТЧИКЕ ИНДУКЦИОННОГО ЛАГА
- МОДЕЛИРОВАНИЕ ИСПАРЕНИЯ СЖИЖЕННОГО ПРИРОДНОГО ГАЗА В МОБИЛЬНЫХ РЕЗЕРВУАРАХ
- МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ИСПАРЕНИЯ СЖИЖЕННОГО ПРИРОДНОГО ГАЗА И АНАЛИЗ ВЛИЯНИЯ ИСХОДНОГО СОСТАВА НА СКОРОСТЬ ИСПАРЕНИЯ
- БЕССЕТОЧНОЕ МОДЕЛИРОВАНИЕ УПРУГИХ ДЕФОРМАЦИЙ ПОЛИМЕРНЫХ КОМПОЗИТНЫХ МАТЕРИАЛОВ ПРИ ИХ СТАТИЧЕСКОМ НАГРУЖЕНИИ
- ПОВЫШЕНИЕ ТОЧНОСТИ ПРОГРАММНО-АППАРАТНОГО КОМПЛЕКСА ДЛЯ ИЗМЕРЕНИЯ И РЕГИСТРАЦИИ МЫШЕЧНОЙ АКТИВНОСТИ(на англ. яз.)